當前位置:
  • 首頁
  • 學術交流
  • 學術長安 華山論劍:“深度學習與大數據感知”國際研討會專家觀點分享

學術長安 華山論劍:“深度學習與大數據感知”國際研討會專家觀點分享


在5月25-28日舉辦的2017“深度學習與大數據感知”國際研討會暨第十八屆學術周上,包括國家973項目首席科學家、長江學者、IEEE Fellow、國外高校Chair Professor、Distinguished Lecturer 等在內的33位國內外權威專家學者帶來了他們在人工智能領域最前沿的研究成果, 45場學術報告精彩紛呈,華山論劍,學術爭鳴,引爆多個當下的AI熱點。本文根據學術周期間的現場速記進行整理歸納,將專家們提出的主要觀點及報告內容再次呈現出來,供大家參考。

韓崇昭:基于腦認知機理的條件證據理論及其深度學習方法


在網絡化系統對智能感知的需求方面,韓崇昭教授介紹,多平臺協同作戰戰術信息系統,需要在武器協同數據鏈的支持下,將武器平臺、傳感器平臺和指控單元進行有機地交聯,完成目標探測與識別,目標跟蹤與定位,目標協同精確打擊與評估等功能,我國對網絡化協同作戰的重大需求是未來要具有“遠離國土的三軍協同作戰能力”,“亟需研究滿足遠離國土超視距作戰環境中武器協同作戰戰術信息處理的理論與方法”。

在基于腦認知機理的條件證據理論研究進展方面,韓崇昭教授指出:“人和動物的認知機理一直是認知科學和人工智能研究的重點,人類和動物大腦進行信息融合的機理研究仍然是一個廣闊的領域,啟發我們建立基于生物多模異構信息融合機制的多源異構信息融合方法,從而達到非結構化信息互補集成的目的。”另外,隨機集理論是統一人工智能各個分支的一個有效的數學工具,Dempster-Shafer合成公式就是用隨機集的觀點來看就是隨機集的交運算,如此晦澀的證據合成理論變得如此簡單,“我們可以合理的期望利用隨機集理論得到更為有用的結論。”研究異構信息融合時,韓崇昭教授認為必須具有兩個基本觀點:1、萬能分類器是不存在的;2、對多分類器系統而言,影響分類結果好壞的主要因素在于其中各分類器的性能互補或相異性。韓崇昭教授提出了異構特征空間同化的方法:“異構特征空間的同化必須同化到相同的類集合上來,然后進行處理。”

在條件證據理論的深度學習方法及其應用方面,韓崇昭教授認為:“深度學習方法是一個新的方法,沒有現成的東西借鑒,我們的思路是1、以實際問題為背景,建立適合條件證據理論的應用框架;2、以實際數據驅動推理過程,并以真實數據驗證推理結果的合理性或正確性;3、修改條件證據理論,達到比較實用的程度。”


孟德宇:如何度量張量的稀疏性


孟德宇教授介紹了度量張量的稀疏性的研究成果,他指出“張量是一個很寶貴的資源”,它有有更豐富的結構,更本質的信息,“我們的期望是仍然保持原來張量的結構,而不是退化為一個向量或一個矩陣,從而盡可能的挖掘其中的信息。”孟教授如是說。目前,張量稀疏性的研究成果還不多,現有的主要研究方法基本思想是將張量各個維度展開后各個矩陣獲得的秩加權求和,最基本的加權就是平均,但孟德宇教授指出這個方法有三個問題:一是它沒有物理含義,二是這種張量稀疏性的描述和矩陣的低秩性、向量的低秩性是不統一的,沒辦法在同一個框架、同一個物理意義下去理解,三是操作性問題,即λ怎么選。對張量進行低秩分解中有兩種主流的分解方法,一種是Tucker分解,一種是CP分解,孟德宇教授介紹:“Tucker張量對于張量稀疏性的描述優勢在于它可以體現出在每一個維度張量展開的矩陣的低秩性,問題在于中間的核張量里面的形態我們一無所知,更不知道里面有什么信息。”“CP張量的優勢在于它的稀疏性的表達和矩陣及向量之前的基非常一致,理解起來非常直觀,問題是不能體現每一個維度的低秩性。”針對上述張量研究中存在的問題,孟德宇教授經過研究給出了一種張量稀疏性的表達:

這種表達把Tucker分解和CP分解兩種方式融合了起來,其物理含義非常清晰,即“要表達一個張量的時候到底需要多少Kronecker基,Kronecker基是對應張量空間里最簡單的張量”,“一階的稀疏性和二階的稀疏性其實就是Kronecker基的描述”,從而解決了張量和矩陣、向量的描述不統一問題,“在此框架下可以導出一個非常自然的自適應加權方案”則解決了λ怎么選的問題。孟德宇教授在此基礎上做了三個應用模型:Tensor recovery mode、lTensor completion model和Tensor robust PCA model,并將這三個模型分別應用到了高光譜圖像去噪、高光譜圖像填充以及背景提取的問題中。


潘泉:變分貝葉斯聯合優化及應用


潘泉教授基于天波超級雷達的應用及戰略預警系統要求的背景下,在信息融合領域做了多年的研究,他指出傳統信息融合序貫處理模式的主要問題有三方面:“單一方法只能解決某一類問題,無法處理更復雜的情況”、“采用算法序貫‘拼接’處理復雜問題,會造成誤差的累積傳播”、“處理結構開環,沒有利用信息的閉環反饋”。現代雷達發展趨勢是認知化、軟件化、網絡化,這個趨勢提出了信息處理與融合必須考慮具有反饋、聯合處理的一體化架構,潘泉教授介紹了已經出現的一系列聯合的概念和方法,如TBD、JCE、JAE、JTC,他還進一步提出思考:“我們能不能考慮一個新的信息處理的方法,重新構造一個信息處理的架構,打破過去信號處理點跡、數據、估計、識別這樣的一個藩籬,我覺得這個時代應該到來了,未來應該沒有信號處理、數據處理之分,它們應該都是軟件定義,它們之間應該是高度綜合融合的,現在的問題是有沒有好的算法能把它們放到一起來考慮,這是一個很大的挑戰。”

目前,天波超視距雷達目標跟蹤面臨的困難有:目標來源的不確定性;傳播模式的不確定性;電離層虛高的不確定性;信息獲取能力不足;系統存在電離層環境與目標特性深度融合。對此,潘泉教授強調:“如果采用序貫方式做,實現是實現了,但是性能總還有提升的空間,還存在許多風險和誤差,雷達層傳感器和電離層傳感器必須要聯合”。

潘泉教授在變分貝葉斯框架下做了VB-JDT算法,算法提供了目標起始、跟蹤、維持全套解決方案,這是目前該領域國際上第一個完整全套VB做的算法,實現多路徑量測檢測,跟蹤層的分層融合,閉環迭代的處理結構,有效解決耦合問題,多項式的計算復雜度,能避免組合爆炸問題,具有迭代收斂性保證以及估計性能下確界。在對算法的各種性能指標都做分析,在不同信噪比、不同量測精度情況下做了對比之后,證明此算法突破了在估計與辨識耦合下國際上傳統序貫方法的處理局限,顯著改善了OTHR目標航跡連續性,顯著提升了飛機、艦船目標的監測跟蹤性能,同源斷裂航跡判斷準確率大于70%,跟蹤距離精度提升了近50%。展望未來,潘泉教授表示:“這個方向已經比我們想象的走得更遠,現在已經把深度學習把智能的方法直接引入貝葉斯的整個框架中間來,聯合估計與辨識已經成為了現代信息融合的解決思路,現在大家拓展的是把變分和大數據、深度學習結合在一塊,現在已經有文章在干這個!將來南海識別區天波雷達會成為主要的裝備之一,這也將是我們的主要工作。”


杜培軍:Scene Representation and Classification from Remote Sensing Images Based on Deep Learning


遙感影像的研究通常是面對像元的,針對城市遙感中地學應用的需求,杜培軍教授指出“但是地學上遠遠不能只考慮像素,要考慮領域尺度信息。從應用來說,則是考慮怎么樣綜合多元多分辨率的各種數據,為整個城市的擴展、生態環境演變、城市規劃管理、建設智慧城市等提供支持。”對于城市的管理需要歸納出商業用地、住宅用地等等功能區,對遙感圖像的分析也因此要求往場景分類上發展,杜培軍教授說:“基于亞像元-像元-對象的遙感圖像分類已經基本可以滿足地物覆蓋信息的提取,但城市研究中需要更加高層次的空間語義信息,因此目前基于遙感數據可提取的信息與實際需要之間存在信息不匹配問題,傳統的方法很難做,我們就在深度學習中尋求更好的方法。”遙感圖像場景語義理解的關鍵是場景圖像特征提取和表達,根據所提取特征的層次,又將其分為基于低級特征的場景內容表達,基于中級特征的場景內容表達和基于深度學習的場景內容表達,潘泉教授應用深度學習的方法,改進融合模型,保持多模型特征之間的差異性,提出監督-非監督特征融合的方法,對于深度學習在遙感影像中的應用,他指出“從地學角度來說,希望遙感影像解譯是具有地學語義的,深度學習在這其中的應用有很好的效果,但適應性還是存在問題需要進一步研究解決,要充分利用多層次、多模型特征來對場景圖像內容進行表達,圍繞城市地區的應用,還需要為場景尺度的選擇、場景邊界的精細化等問題進一步研究。目前,絕大多數遙感影像解譯的文章沒有用到光譜特征,有地學解釋意義的信息加入進來應該會有更好的效果。”


張軍:大數據、云計算、物聯網:計算智能的研究前沿與應用


張軍教授首先分享了他對大數據的思考,他從計算機的發展歷程角度看,早期的計算機科學是算法的科學,到了并行計算時代是算法互動的科學,而云計算時代是算法、人、物互動的科學,計算機科學和電子工程、自動控制等等都結合到了一起變成了信息科學,I/O設備變成了物聯網,計算模式變成了人工智能、超級計算和云計算:“大數據是物聯網與新型計算模式發展的產物”,張軍教授也指出:“大數據、云計算和物聯網的核心是人工智能”。計算智能包括了模糊邏輯、神經網絡和演化計算,張軍教授認為:“演化計算是目前數學證明最薄弱的,是最不成熟的”,演化計算已成為人工智能的學術前沿。


劉靜:What Can Evolutionary Algorithms Do on Complex Networks


劉靜教授首先對復雜網絡和進化算法進行了簡單介紹,復雜網絡在現實中廣泛存在,它揭示相應的復雜系統的特征,劉靜教授指出復雜網絡的特性是:“任何一個網絡中,無論是生物網絡、社會網絡還是人際交互網絡,都會發現只有很少數的點的連接度是非常大的”。用進化算法去解決問題時,劉靜教授認為:“只要定義了:1、種群、個體如何表征,2、要解決的目標是什么,找到什么樣的解,3、進化算子如何設計,4、怎樣選擇得到的解,定義了這四個元素就定義了算法。”在復雜網絡的問題上,劉靜教授把進化算法解決的問題分為兩部分,一部分是從復雜網絡中去學習,一部分是把學習出來的知識反作用于網絡上。其中第一部分做的最多的是社團檢測問題,社團檢測問題“實際上是對已有網絡結構如何劃分網絡的節點或邊,使得這種劃分能滿足我們的需求。”劉靜教授介紹,用單目標、多目標的進化算法來解決社團檢測問題,可以從方法去研究,可以從社團的類型去研究,也可以從網絡的類型去研究。第二部分相應的是設計魯棒的網絡,研究網絡魯棒性考慮兩個因素,一個是網絡保持功能的能力,一個是網絡承受其點或邊失敗或波動的能力,劉靜教授指出:“結構的優化遠比社團檢測要難,對點攻擊要魯棒,對邊攻擊要魯棒,就有多目標的用武之處。”


孫濤:大數據與AI時代


孫濤博士首先介紹了大數據及華為在大數據服務方面的進展,他指出:“大數據分為兩大類,一類是人產生的數據,另外很大一部分是來自于工業數據,隨著物聯網的發展,尤其無人駕駛現在一天能產生幾十個T的數據,機器產生的數據將會是未來另外一個具有挑戰的問題。”華為公司現有圖計算,實時服務,DIS服務等,瞄準大數據的4V特征,挖掘數據金礦,孫濤博士介紹,華為擁有多種數據洞察方式,更快的分布式查詢服務以及更強的流處理服務。

大數據從11年開始興起,發展至今已經不再是新興技術,而是成熟的技術并得到應用,孫濤博士說:“取而代之的是機器學習、語音識別等AI的技術,現在是深度學習為代表的技術在引領AI趨勢,發展方向包括語音識別、圖像分類和自然語言處理,我們比較關注的也是這三個方向,因為它們正好代表了人類感知的延伸”,目前,孫濤博士提到的這三個受關注的方向的發展情況是“語音識別作為未來人機交互的方式比較受到各大商業公司的關注;自然語言處理是一個公開問題,大家一直沒有解決掉,華為在翻譯這塊做得還可以;圖像識別幾個大的應用,一個是圖像分類,一個是人類識別,近端人類識別效果已經比較好了,支付寶上的人臉識別安全性已經超過指紋識別,已經得到金融安防的可靠認證,但遠端的人臉識別準確率還不高。”

芯片是AI發展的另外一個重要支撐,訓練階段對芯片的需求是大計算+大存儲+大帶寬,推理側的需求是低功耗+有限空間+實時處理。孫濤博士提出未來芯片要解決的一個關鍵問題是:“怎樣構建像人腦一樣高效、高能耗的芯片,當前芯片和人腦的消耗差了六個量級,就是10的6次方,現有技術大概能提升3個量級,但還是有3個量級的差距。”


金耀初:數據驅動的進化優化


報告開始金教授就指出他多次在公開場合提出“高維多目標的優化若是利用傳統的兩三維目標優化算法來做是有很大局限性和問題的”,同時指出現如今有很多學者盲目的使用進化算法,但是這是不對的,一定要根據自己所需要解決的問題來判斷進化計算是否適用,金教授認為“進化計算的思想非常適用于多目標優化的問題”,在報告里金教授對在大數據環境下的進化計算方法的設計所面臨的挑戰提出了自己的觀點,那就是“如何減少算法的計算量是在大數據環境下迫切需要解決的問題”。此外,金教授還提出了另一種在小數據環境下的挑戰,就是如何在樣本數據非常稀少的情況下設計進化算法。


孫富春:面向機器人靈巧操作的認知傳感與大數據處理


孫富春教授在報告開始就說“機器人是自動化的最后一公里,靈巧操作是最后的一厘米,那么認知傳感就是最后的一毫米”,所以可見認知傳感在機器人的靈巧操作上非常重要。孫老師指出“新一代機器人一定是基于認知傳感技術的”,比如人手的觸覺在腦區究竟如何表達,之后各個腦區怎樣合作進行融合,融合的信息怎樣去實現已操作目標和環境的認知,最后如何利用人的認知本能再加上經驗進行動作的預測和運動的控制。同時提出“如今能為我們進行服務的技術有云技術,大數據處理技術,類腦認知技術,以及先進的分布式的控制技術”。報告最后,孫教授就下一代機器人所面臨的挑戰進行了說明,其中包括機器人認知的體系結構要像人腦一樣并行;而且能夠實現對不同形態信息的表征,特別是跨模態的信息表征和處理;另外還要有像人一樣的認知本質。


焦李成:深度學習影像感知與解譯


報告開始,焦李成教授說道“提及深度學習,大部分人首先想到的是像吳恩達、于凱這樣的紅人,首要的反應就是深度很火,且無所不能,無所不在,但是越是此時我們越是要清醒,其實神經網絡的發展也代表了人工智能發展的一個側面,也代表了機器學習的一個側面”。之后焦李成教授介紹了一大批國內外神經網絡學科的前輩科學家,并強調“現如今的深度學習在商業領域之所以如此受到推崇,是由于那些前輩科學家的貢獻為其奠定了堅實的理論基礎”。焦李成教授在報告中指出“和當初的神經網絡相比,現在的深度神經網絡理論進展并不大,但是由于當前大數據對象的需要,又有計算機硬件軟件技術的發展,才促成了現在的神經網絡可以加很多層可以做很多事。”報告最后,焦李成教授對我們年輕一代的研究者提出了希望,“這是大數據和深度學時的時代,但也是年輕人的時代,解決智能人機交互,智能自主學習,智能推理以及智能自動駕駛是未來我們需要解決的深度學習難題”


楊少毅:Robot到AI


楊少毅認為:“人工智能的發展趨勢是社會進步的必然選擇,大數據時代的來臨,將加速人工智能的發展。”楊少毅指出:“像人一樣,人工智能的發展也需要學習,這些知識和經驗是以海量的數據為支撐,這樣,人工智能的巨大潛力才可能被逐步釋放。如果把人工智能比作火箭,大數據就是燃料。”


張向榮:基于深度學習的遙感影像解譯


張向榮教授應用深度學習的方法在路徑提取和高光譜感知圖像分類方面做了研究工作,全卷積網絡FCN擁有杰出的圖像分割能力,張向榮教授介紹采用FCN進行路徑提取,在FCN4s模型的基礎上加入權值-損失函數,解決了樣本正反例不平衡的問題。此外,她還基于GAN做了完善改進應用于路徑提取。在高光譜感知圖像分類中,張向榮教授則使用了RNN、LSTM,都取得了良好的成果。


史玉回:頭腦風暴優化算法


史玉回教授在報告開始時指出“現如今的粒子群算法在很大程度上都是基于低等動物的群體智能行為提出的,而人類作為高等動物會很聰明,那么一群人的群體行為是否可以抽象出來形成優化算法?”針對這一疑問,史老師提出了頭腦風暴優化算法。并認為“當想要仿真問題擁有者在一群想法中挑選其認為好的想法這類問題時,由于頭腦風暴優化算法和維數無關,所以很適用大規模的優化問題”。報告最后,史玉回教授提出“群體智能的主要問題是優化,需要把所有的問題描述成一個優化問題,如何把許多目標優化問題分解成多個多目標優化問題并可以并行化運行,是頭腦風暴的挑戰”。


杜蘭:卷積神經網絡及其在SAR圖像解譯中的應用


杜蘭教授在報告中認為“深度學習在近年來的發展非常快,很多人工智能的應用領域都有用到深度學習的方法,另外學術上也有很多關于深度學習的研討會,甚至一些應用領域的期刊都有發表深度學習的專刊,但是深度神經網絡學習卻并不是一個新的概念。它的出現和我們計算量的提升以及大數據的背景是分不開的。”


鄔剛:基于FPGA的深度學習加速方案


鄔總在報告開始就申明“我的報告和別的專家的思路不太一樣,是從硬件的角度來看在機器學習上該怎么做,更多的是從工程化的角度來做硬件加速。”鄔總指出“FPGA是用異構的計算來提高計算能力,而計算能力決定算法演進的速度。FPGA最大的優勢就是通過互連的方法,通過高性能計算網絡接口的方法,可以實現更高性能的訓練,因此,把學習算法載入到硬件芯片FPGA中,是使算法運行加速從而滿足實際應用的必然手段” 與此同時,鄔總也指出了“BP算法的反向傳播是影響硬件最大的瓶頸,這是因為反向傳播會造成巨大的串行,此外,算法的訓練模型也有待改進”,所以報告最后,鄔總呼吁學術界,希望可以改變這種算法的反向傳播,盡量用正向計算,以及壓縮訓練模型找到最佳架構,使得算法和硬件可以更好的匹配。


侯彪:高分辨率SAR圖像目標檢測


侯彪教授介紹,隨著SAR圖像分辨率的升高,車輛目標已有明顯變化,不再是一個或少數幾個點,而是一片區域,SAR圖像分辨率的升高帶來了更多細節信息,這對處理速度造成了挑戰,對這些信息的系數花表示成為了重要的問題。傳統CFAR方法在中低分辨率的SAR圖像目標檢測中效果較好,但在高分辨SAR圖像上表現不佳,針對前述種種問題,侯彪教授提出了分層字典學習方法,分層的依據由對高分辨SAR圖像進行初分類的結果得到。


姚新:Online Ensemble Learning of Class Imbalance Data


姚新教授認為“分類問題中類別的分布是不平衡的”,例如工程中的故障診斷,大部分數據是正常的,只有小部分數據是不正常的,這就是不平衡,針對不平衡分類的學習,有沒有什么辦法能把學小類的性能提高,同時又不損失大類的學習性能呢?姚新教授給出了他的想法——AdaBoost.NC算法,姚新教授說:“在AdaBoost算法的基礎上,加入數據間的多樣性”、“考慮樣本點是大類出來的還是小類出來的,如果是小類出來的,學習它的機會就給多一點,大類的就少一點;考慮數據的相似性,相似的就少學,就將這個思想做成算法。”新教授也提出了新問題:online class imbalance learning,他將在線學習定義為“處理數據流的學習”,此時不能認為數據的概率分布是始終一樣的,需要考慮時間漂移,且在線情況下大類、小類的區分也不是固定的。對此,姚新教授提出了Online Bagging +Re-sampling算法,其主要思想是對小類Over-sampling,對大類Under-sampling。姚新教授最后提出的一個方法是多目標的方法,姚新教授說“多類的分類只看精確度的話老被大類拽著走,把每一個單個的class都作為目標,無論是大類小類當成同等的目標,就不會產生大類控制小類的情況。”


Hisao  Ishibuchi:Current Hot Topics in Many-Objective Optimization


Evolutionary many-objective optimization is an active research area in the field of evolutionary computation. A large number of new algorithms as well as a variety of modifications of existing algorithms have been proposed for multi-objective optimization problems with four or more objectives. In this presentation, we focus our attention on current hot topics in evolutionary many-objective optimization. First we will look at some attempts to prepare new test problems and a new test suite of existing test problem. The basic idea is that we need a variety of many-objective test problems. Next we will discuss the population size specification for fair performance comparison of many-objective problems: There may be at least four ideas: The same population size for all algorithms, selection of the same number of solutions from the final population, selection of the same number of solutions from the examined solutions, use of all the examined solutions. Then we will point out the importance of an appropriate specification of a hypervolume reference point for fair performance comparison through the discussions on the optimal distribution of solutions for hypervolume maximization. We also discuss the optimal distribution of solutions for IGD minimization.


劉宏:Online Growing Neural Gas for Anomaly Detection in Changing Surveillance Scenes


劉宏教授開場即表示,他以及他的團隊的使命始終是讓機器人更加“耳聰目明”,即機器人的視、聽、思維,致力于做機器人“脖子以上的工作”。劉宏教授認為做機器人要注重三個結合:第一,注重視覺和聽覺的結合,就如人的能力依賴于視覺聽覺,機器視覺能力有限、聽覺有限,但融合起來能力就能大幅度提高;第二注重感知與運動結合;第三注重技術和產業結合,融合人工智能技術和機器人產業。劉宏教授現在以及未來十年的主要工作是開發北大智能人工頭系統,他“堅信人工頭是人工智能和機器人結合的最佳載體”。機器視覺方面,劉教授介紹了用在線GNG方法對變化的監控環境中的異常行為進行檢測,其中關鍵的思想是給GNG增加在線更新的能力,讓機器適應從少見多怪到習以為常的變化,算法的效率和魯棒性都得到了提高。聽覺方面,劉教授團隊目前最重要的是做了聽覺定位,機器聽覺定位的難點在于不僅僅要定位偏轉角,還要定位俯仰角、距離,同時要考慮抗噪。


劉康:基于深度學習的知識問答


劉康老師介紹了基于深度學習的知識問答的方法,開始時他指出“搜索引擎是返回相關的文檔,是以列表的形式提供文檔,是不是有方式能直接、精準的給出答案?”隨著屏幕越變越小,劉康老師認為列表的形式不再適合在未來和用戶交互,知識庫結構化技術則是未來的方向,這項技術目前已經有相關應用,例如搜索中國有多大,會看到直接的數字答案,這就有別于以往的搜索引擎。那么基于知識庫的問答究竟是怎樣做的呢?劉康老師介紹:“知識圖譜是結構化的,知識庫問答將問句通過語義解析的手段變成語義表示的一種形式,在結構化的知識庫或者知識圖譜上通過語義匹配、查詢、推理等手段,能夠獲取答案。”按照基于語義形式表示方式的不同,知識庫問答的方法分為兩類:一是基于符號表示的方法;二是基于分布式的方法,它能夠將問題表達為實數的向量形式,把符號匹配的過程轉化為向量之間數值的運算。劉康老師指出傳統基于符號表示的方法遇到的挑戰有:1、語義鴻溝; 2、級聯式多項NLP處理帶來的錯誤傳遞;3、開放域環境下如何進行semantic parsing。對傳統的解決方法中的種種問題,劉康老師指出“我們可以看到,基于Deep Learning的技術用分布式的知識表示形式能夠有效改善傳統符號處理中的語義鴻溝問題,而基于Deep Learning的端到端的知識問答系統能使得復雜的問答過程可學習,同時基于深度學習的文本生成是完成自然問答的有效途徑。”至于基于深度學習的知識問答還存在的問題則有三個,即問句的精準語義表示;問答過程可解釋;仍然無法替代邏輯推理。


王亦洲:生物啟發的計算機視覺


王亦洲教授指出,深度學習技術讓識別變得越來越簡單,在這樣的大背景下,他思考“想把模式識別向下一個stage試試。”、“我認為要走到learning to learn。”王亦洲教授研究多智能體的感知學習,他說:“感興趣的是多智能體如何在視覺幫助下自主協同的完成各自的任務,這其中各個agent的任務是不一樣的。”王亦洲教授認為:“很多視覺和機器人的結合是沙灘上的建筑,是沒有根基的,因為我們的圖像大多是擺拍的,在真實的環境中,智能體是否也有相同的表現?這才是重要的。”他指出,類真實的虛擬環境能提供可控的數據去訓練和評價智能體或者算法,智能體應在和環境的交互中學習,而不是靜態的圖像。


王琦:復雜場景中人群行為的研究及其應用


隨著人口增多和人群活動的增加,安全問題日益成為人們關注的熱點問題,王琦教授指出“如何通過智能視頻監控的手段解決安全問題,尤其是公共安全問題”值得研究,這能“推動智慧城市的發展,推動平安城市的建設”。王琦教授對于人群行為分析的研究主要有以下方面的內容:人群檢測與跟蹤、群組檢測和人群行為的量化。王琦教授介紹,在他的研究中引入了個體行為的集體度和群體行為的集體度,進而從量化的角度對人群行為進行度量,行為集體度的度量是根據特征點的拓撲關系來分析的,涉及到拓撲關系如何建模和分析,王琦教授指出這存在三個難點:“首先是特征提取,其次是運動狀態建模,再次是個體關系探究。”特征提取的難點是特征局部化難以表達群體的宏觀特征,運動狀態建模的難點在于個人運動模式的動態變化難以掌握,涉及到動態建模,個體關系探究則難在群體中空間結構復雜,難以分析個體關系。針對以上問題,王琦教授給出了基于多視角聚類的無參數群組檢測方法及基于個體分析行為量化與群組檢測方法,“多視角就是從多個方面提取特征”,基于多視角聚類的無參數群組檢測的總體思路是探究全局關聯線索,利用微觀與宏觀視角的特性互補,解決特征局部化的問題。基于個體分析行為量化與群組檢測方法中,每個人在人群中變化軌跡是有目的性的,引入行為意圖這個隱含變量,度量的過程當中認為人群中是有拓撲關系的,關系比較密切的、離得比較近人的拓撲結構會比較相似,王琦教授指出“充分挖掘拓撲關系,能更好的處理具有復雜結構的人群。”


鐘偉才:華為FusionInsight數據挖掘平臺與AI云服務


鐘偉才博士從工業界的角度談了大數據分析和AI云服務,大數據的市場規模17年能達到500億,發展趨勢則從營銷轉向用戶體驗,鐘偉才博士指出“目前大數據最賺錢在服務器和存儲,因為客戶還在1.0時代,到大數據2.0,未來趨勢就是用戶體驗”。大數據分析的演變歷程是“描述分析到預測分析到指令分析到認知分析”,大數據行業的發展在16年是1.0時代,是簡單的存儲和報表式的分析,2.0時代將是數據變現問題,大數據分析上云也是行業未來的發展趨勢。鐘偉才博士曾擁有傳統數據分析的行業經驗,這也引發了他的思考:“大數據分析怎樣跟傳統數據分析去PK,市場在哪兒?”在傳統數據分析已經占據80%-90%市場的情況下,鐘偉才博士認為“不僅要處理大數據,還要處理小數據,通過大數據平臺反打傳統數據分析市場。”目前大數據分析的瓶頸問題是用戶需求多種多樣,對每一個用戶都進行定制勢必不可行,對此,鐘偉才博士提出“以統一分析平臺為核心,去孵化行業內可復制的分析解決方案”。

RTD業界的趨勢是fast data,鐘偉才博士稱未來的數據處理“時間是ms級,數據是易腐爛的”、“要在數據沒有腐敗之前將數據的價值發揮出來”,他認為對于數據處理,未來是云端和終端協同。


楊淑媛:稀疏濾波與張量深度網絡


SAR成像的機理導致其特征提取不如光學成像那么容易,用手工特征、光學特征提取的方法都不可行,對于SAR影像特征提取困難的問題,楊淑媛教授介紹了用特征學習來提取特征的方法,研究思路是“把字典學習、多字典學習在線性條件下找特征推廣到在非線性條件下去找特征,現在深度神經網絡在很多識別任務中表現得都非常好,所以我們就試著用深度學習的方法來提取SAR圖像的特征”。楊淑媛教授指出訓練深度神經網絡尤其應該關注其推廣能力,在她的工作中用了稀疏濾波作為基本單元來構成網絡:“稀疏化這種生成網絡的鏈接或者是神經元的輸出,利于它的結構,可以減少參數的數目,有助于提升生成網絡的放大能力。”楊淑媛教授還介紹她的一項研究嘗試,利用張量的方式做信號的復原,用sparse coding 張量編碼,把sparse coding的方法用到了圖像融合和分類里。

楊淑媛教授認為:“稀疏性對于深度網絡的推廣能力還沒有一個很好的理論結果,但是也許稀疏性能提高推廣性能。稀疏濾波單元是一個有效的深度神經網絡單元,它計算簡單,沒有太多參數,可將其作為基本單元建立一個輕量級的深度網絡;把濾波的模型擴展到張量的形式,可以處理更多的情況,比如可以處理異構的數據,經過試驗,提取出來的特征是具有判別性的。”她指出張量的研究才剛剛開始,還很粗淺,理論研究上還可以再深入。


李軍Remote Sensing and Social Media


李軍教授認為大數據不止是指數據量大,還包括數據增長速度快、不確定性強,且涉及數據采集、存儲、恢復等方方面面,而遙感是典型的大數據處理問題:“遙感的數據是pixel級的、像元級的,一個小圖像就會產生大量的數據”、“處理和傳輸上希望5秒,不然數據就被覆蓋了”,此外遙感數據要受到設備的局限、時空的局限,“光學衛星數據并不是時時都有,要結合地理、天氣等等因素,SAR數據使用的門檻很高,高光譜數據很少,只有一顆衛星,很傲嬌,獲取的數據空間分辨率和光譜分辨率都可能不高”。面對遙感數據處理中的種種難題,李軍教授提出了把遙感數據和社交數據結合起來的思想:“現在,社交媒體數據時刻都在產生,量很大,也可提供更精確的描述,例如在降水天氣可能得不到遙感圖像,但如果有前一天的遙感圖像,那么結合社交數據就可以做降水分布圖等”。這種結合將生態壞境信息獲取和社會感知結合了起來,兼顧自然客觀與社會經濟要素。同時,李軍教授也指出了這其中存在的難點:“現在的難度是數據的收集,目前數據的擁有者都是商業公司,獲取數據的難度比較大,我就想我們能不能自己建立一個project,大家可以自發的在上面發布消息,所有人都可以開源共享這些數據,所有人既是數據的發布者,又是數據的收集者,做研究的人就能都有許多數據”,第二個難點是語義問題:“社交數據通常有位置、有文本,信息非常豐富,但其中的語義問題會給數據解譯帶來一些難度”。兩類數據量綱、尺度、精度等存在不一致的問題,如何將信息有效的融合是未來挑戰。賓夕法尼亞大學教授Nigel Waters和Guido Cervone曾在2013年應用遙感數據和社交數據結合對科羅拉多洪水災害事件做了事后的圖像分析,李軍教授也在2016年用遙感數據和微博數據結合做了武漢和深圳降水的監測研究,但對于遙感和社交數據的結合的研究還有待進一步深入。


陳莉協同過濾關鍵技術及其稀疏性研究


數據量的爆發加速了科技發展,但同時也帶來了信息過載等問題,陳莉教授指出:“信息過載的解決工具之一是推薦系統。”推薦系統有三個基本要素:豐富的數據聚合,其中涉及到數據的采集、解析、預處理;關聯的參考結構,建立字典、知識庫、本體等;有效的算法。陳莉教授說:“發展到今天有很多挑戰性問題,第一是數據稀疏性問題,二是推薦準確度,三是系統擴展性,推薦多樣性問題,冷啟動問題。”針對這些問題的解決,陳莉教授介紹了六個推薦算法,她還進一步展望:“解決實際問題的算法,多元異質數據的融合非常重要,多元數據融合當中會包含非常多的數據類型和特征,從這個角度入手可能也值得研究。二是利用用戶的情景信息,我們已經發現在多樣性尤其時序多樣性方面有非常好的表現,相信也會有新的應用領域,不止是電子商務領域,比如社交領域、眾包等。”


陳歡歡:地下管網探測


隨著城市的發展,地下空間的利用日益重要,陳歡歡教授介紹:“地下管道其實也是城市的血管,包括下水管道、燃氣管道,通信電纜等,各種管道材質不一樣,對它們探測的時候單一的傳感器很難探測得很精密,我們就思考有沒有一種設備可以現場實施探測出地下管道的情況。”目前,國內對于地下空間的管理存在諸多問題,例如歷史管網檔案遺失,管網權屬部門太多,檔案分散,施工中“撞線”,管線位置精度不夠,管道故障的快速檢測設備缺少等等。陳歡歡教授曾在英國參與了Mapping the Underworld項目,通過多維傳感器來構建地下管網地圖,回國后他繼續了此方面的研究,從算法研究-快速信號處理與數據融合、軟件協同-地理信息系統協同、系統構建-多傳感器的系統集成三個方面做了諸多工作,針對國內的具體情況提出了解決方案,在老城區使用多傳感器設備:地面穿透雷達、主動電磁場、被動電磁場、用深度學習訓練地面及井蓋識別視覺傳感器、GPS融合地理信息,新城區使用智慧管道RFID標簽等。陳歡歡教授的多通道地面穿透雷達系統已經可以實時獲取探測圖像,算法上,非同態雙曲線擬合+概率混合模型+貝葉斯信息準則有很好的實時性,可做到1秒處理100+管道。


張艷寧:高分辨率圖像智能處理技術


高分辨率對地觀測在國家安全戰略和社會經濟發展等方面發揮著越來越重要的作用,對其發展現狀,張艷寧教授介紹:“分辨率越來越高,但由于硬件、平臺的不穩定和環境的影響,成像質量還是不夠;此外數據智能處理水平有限,一是協同能力二是海量處理能力還不滿足需求。”針對高分辨率對地觀測的現狀和問題,張艷寧教授介紹了她在圖像清晰化處理技術研究中的成果:去模糊最重要是估計模糊核,提出方法提取可靠的圖像結構,主要的核心思想是依次激活最可靠的圖像梯度;解決不一致的模糊的問題則用數據驅動的方式,學一個深度學習模型,做端到端的估計;超分辨的難點中,利用變形性質表示字典中不存在的圖像塊來解決低分辨率怎樣映射到高分辨率的問題,把非單一的梯度模式分解回單一的梯度模式來解決精細高頻紋理的重建問題;把類內光譜相關性和光譜類的結構具有稀疏性相結合,進行聯合建模解決去噪問題。

協同也是現在張艷寧教授特別關注的,她說:“思路就是三個臭皮匠能頂諸葛亮,可見光、熱紅外、高光譜,單獨用它們看看不到,但協同之后效果就比較好。”張艷寧教授在對黃河的遙感監測中就應用了協同感知:“一個是方法之間做了協同,偏度分析主溜檢測也可以檢測出來,光譜相似性演進主溜檢測也能檢測出來,就做了這兩個方法的協同。另外是人和系統的協同,人和系統分別觀測,然后交換信息做修正。”

張艷寧教授分享她對未來的展望思考:“以后想做技術創新方面,想做協同,想在技術標準規范方面想做點成果,要把一體化應用平臺做好,做空天地一體化,除了在西安,我認為我們也要在外面布局,藍色海洋是一塊塊大蛋糕,大家要去切,將在青島建研究所,空天地海一體化針對海洋經濟去做。”


薛建儒:無人車場景計算與自主運動


無人駕駛汽車是當前的研究熱點之一,薛建儒教授認為無人駕駛帶來的顛覆性變化有三點:出行更加安全、綠色;共享、共用會更加深入人心;道路會變得非常暢通。無人車的技術路線分成兩個大類:“一個強調自主智能,通過多傳感器融合的環境控制來實現魯棒的控制,第二是互聯智能,車和車之間、車和交通之間的互聯互通,它對自主智能的要求會下降,但對環境的要求增高,這兩條技術路線會相互促進,最終融合成一條技術路線。”人類駕駛汽車中視覺的信息非常重要,但無人車的數據處理中甚少視覺信息的運用,薛建儒教授認為這非常遺憾:“無人車里主要還是靠激光雷達、毫米波雷達來實現對環境的感知,例如前向碰撞檢測、停車雷達還是靠超聲波等非視覺的信息,這也是我們做視覺學習的一個主要原因。” 實現無人車感知到運動的閉環要解決兩個問題:場景計算和自主定位,在場景計算方面,薛建儒教授提出的主要思想是“讓視覺在無人車中起到主導作用,以視覺傳感器為主,其他傳感器為輔,通過視覺把其他的傳感器的信息統一起來”。交通場景的結構化描述分為靜態場景和動態場景,在解決了靜態和動態場景的結構化描述問題以后,薛建儒教授“搭建了一個視覺主導的場景計算框架,我們的主要貢獻是跨模態和跨尺度的時空對齊與配準,并且在此基礎上把低精度的地圖信息放進去構成對場景結構化的描述,實現從幾何度量到推理和預測。”


高新波:大數據時代模式識別的機遇與挑戰


高新波教授開場就說:“想跟大家展望一下模式識別怎樣發展”,他指出:“現在的模式識別大致分為三類,一類是統計模式識別;二是句法模式識別,在未來類腦計算領域有可能進一步發展;三是深度神經網絡,現在正在火熱的階段,它最大的問題是可解釋性太差,但現在逐步能解釋了, 比如通過可視化等等。”句法模式識別是知識驅動的,深度是數據驅動的,高新波教授認為把句法模式識別和深度神經網絡結合起來是未來的方向“既知識驅動也數據驅動,數據就會產生知識,知識反過來提升模式識別的能力。”目前,模式識別在很多領域都獲得了成功,但高新波教授認為還有挑戰,魯棒性、自適應性、可泛化性是其進一步發展是三大瓶頸。

對于大數據時代的降臨,高新波教授指出:“大數據的價值不在于大數據本身,而在于對它內容的理解與識別,重要的還是模式識別,識別不了大數據就沒什么作用。”大數據為模式識別提供了新機遇,訓練數據的豐富性將顯著提升模式識別系統的精度和泛化能力,相關領域的成功將推動模式識別與其他學科的協同創新,以模式識別為智慧引擎的IPU或將在下一代ICT體系中占據更重要的核心位置等等。當然,挑戰與機遇并存,高新波教授也提出了模式識別面對的挑戰及可能的研究課題:

a) 面向大規模多源異構數據的魯棒表達

b) 結構模式識別和統計模式識別結合

c) 數據和知識結合,發展人機混合智能

d) 具有魯棒性和自適應性的生物啟發模式識別

e) 基于跨領域模態知識遷移的模式識別

f) 模式識別研究也需要互聯網思維等


石光明:語義通訊


無論是以往的信號的表達、獲取、重構工作,還是現在的大數據、云計算,國內的研究工作基本都是跟隨狀態,石光明教授一直在思考:“我們的工作沒有原創性,我們有沒有可能發起一個方向的引領?”經過研究與思考,石光明教授提出了語義通訊的概念:“我們以往都是從信號層、數據層做事情,那通訊的最終目的是什么?最主要就是要語義通訊!就是我講的東西你能明白,可能我講的波形不一樣、數據比特不一樣,但只要你懂意思就可以了,這是通訊最根本的,所以我就做了語義通訊的思考。”對于語義通訊,實際上還沒有明確的定義,基本架構、核心內容、基本問題等等都沒有相關的研究,石光明教授認為這應該是一個開創性的方向。未來智能設備將無處不在,傳統的數據交互方式將難以滿足人機交互,如何用少量頻率資源做到“達意明情信息交流”是需要研究的問題,石光明教授指出:“通訊的方式應由波形識別代替波形重構,我們的編碼方式、就是每說一句話跟我們過去的知識是有關系的,接收也是隨著知識變化來接收,傳統的以波形保真為原則的通信要顛覆掉。”、“原來的通信注重底層的設計,實際上有了語義通訊概念之后,主要在智能編碼這塊設計,在信號層面就可以混用了。”石光明教授歸納了一些語義通訊的特點,例如以基礎語義為要素,替代比特;多用戶非正交大容量公用信道;底層信號容錯性極強;同域混疊編碼跨域解碼;層級化語義編解碼;基于智能技術編解碼等。同時,石光明教授也指出了一些可研究的課題內容:語義的基本要素刻畫、語義層級結構刻畫、語義容錯糾錯機制、語義信號混疊編碼傳輸機制、語義先驗解意機制、語義先驗創建與維護等。石光明教授說:“所有這些都需要用深度學習的方法來研究,這些概念我還沒有完全想清楚,推進得比較慢,希望大家可以一起來研究推進。”


李陽陽:量子計算、優化與學習


隨著信息獲取技術的發展,面臨海量的信息和不完全的數據,用傳統的方法是不可計算的,對此,李陽陽教授的想法是:“將待處理的問題看做優化的過程,用優化的思想去解決缺乏結構性逼近、學習能力差及傳統方法的一些瓶頸問題。”當計算量比較龐大的時候,李陽陽教授采取量子優化建模的方法來解決。關于聚類問題,李陽陽教授采用多目標的思想:“我們希望建立量子智能多目標優化與學習,來達到高效的海量數據的感知與識別。” 聚類是研究邏輯、物理上數據間的聯系,信息時代有各種各樣的高維數據,但高維數據不斷積分,其維度的稀疏和冗余帶來的維度災難使得李陽陽教授進行了思考,對于海量數據,她用優化來克服密度性局部最優和初始值敏感問題。關于量子智能優化,量子行為其實就是從宏觀來到了圍觀,將牛頓空間映射到了量子空間,考慮它的波動性,用一個波函數來反映粒子的位置,因其不需要方向性,故能降低參數的數目,子空間的聚類則實現維度約減。用具有量子行為的群體智能來優化權值矩陣,再通過權值矩陣再指導中心矩陣的劃分,這就是一個進化學習的過程。李陽陽教授基于MapReduce的QPSO研究,提出了全局優化的量子智能優化算法框架,求解比較均勻,證明了算法的收斂性,并用于求解數值優化,約束滿足優化、組合優化問題;同時也提出了量子多目標優化與學習模型,并用于求解海量數據聚類分類和復雜網絡社區檢測問題。針對傳統的處理方法全局優化能力不足,依賴數據的先驗分布,算法缺乏自組織、自學習能力,算法模型對多目標函數的考慮不足,缺乏智能性等問題,李陽陽教授展望其未來工作:“將進化計算作為智能遙感影像處理的有效手段,因為它可以進行全局搜索、可以考慮多個目標,不需要影像的分布假設,能實現自動確定數據、樣本自主學習、自控確定權值參數等等。”、“希望體現量子計算的協作學習,實現大規模的優化,多目標的方法。”


信息來源:http://www.bjpacx.com/iiip/html/dongtaixinwen/shiyanshixinwen/2017/0620/1844.html